توسعه کنترلر هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک
Authors
Abstract:
افزایش روزافزون تعداد خودروها و در پی آن ترافیکهای سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را بهخوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغهای راهنمایی بر پایه یادگیری تقویتی است. کنترل هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی نیاز به یادگیری و تصمیمگیری در فضای حالت بزرگ (پیوسته) را دارد. همین امر باعث میشود که روشهای رایج یادگیری تقویتی (حالت گسسته) برای چنین مسائلی (با فضای حالت بزرگ) بهخوبی قابل بسط نباشند. هدف تحقیق حاضر حل این چالش در مسئله کنترل ترافیک میکروسکوپیک است. در همین راستا نوآوری تحقیق حاضر را میتوان توسعه کنترلر هوشمند چراغهای راهنمایی بر پایه یادگیری تقویتی حالت پیوسته برای حل چالش بزرگ بودن فضای حالت برشمرد. یادگیری تقویتی حالت پیوسته از شباهت سنجی حالات برای تخمین ارزش آنها استفاده میکند. در این تحقیق بهمنظور اعتبار سنجی، دو روش یادگیری Q و عملگر-نقاد حالت گسسته نیز پیادهسازی و عملکرد آنها با روش پیشنهادی مقایسه شدند. نتایج نشان میدهند که روش پیشنهادی منجر به کاهش 16% و 13% زمان سفر در مقایسه با دو روش عملگر-نقاد و یادگیری Q میشود.
similar resources
توسعه سامانههای چند عامله و یادگیری تقویتی در کنترل هوشمند چراغهای راهنمایی
امروزه یکی از معضلات جوامع شهری، ازدحام و ترافیک خودروها در معابر شهری است که منجر به آسیبهای مختلف اقتصادی، محیط زیستی و اجتماعی میشود. برای جلوگیری از این آسیبها، نیاز به بهبود زیر ساختهای فعلی حمل و نقل در شهرهای بزرگ بیش از پیش احساس میشود. تمرکز مقاله حاضر بر روی کنترل هوشمند چراغهای راهنمایی به عنوان یکی از شاخههای سیستمهای حمل و نقل هوشمند با استفاده از سامانههای چند عامله یادگی...
full textتحلیل و بررسی اثرات ترافیکی و زیست محیطی چراغ های هوشمند و چراغهای غیر هوشمند در تقاطع ها
سیستم SCATS یکی از سیستمهای کنترل هوشمند ترافیک است که توسط کامپیوتر مرکز و با دریافت اطلاعات از شناسگرها، فرمان زمان بندی چراغ تقاطع های یک شبکه را صادر می کند. این سیستم در بسیاری از شهرهای بزرگ و برتر در جهان از جمله تهران به کار رفته است. هدف این گزارش ارایه روشی برای ارزیابی کارآیی این سیستم در تهران است. تاکنون در شهرهای مختلف با روشهای گوناگونی، عملکرد شبکه حمل و نقل شهری را قبل و بعد از...
full textتوسعه ایده های یادگیری تقویتی گسسته در یادگیری تقویتی پیوسته برای سیستم های چند عامله
در جهان پیچیده امروز برای انجام کارهای متفاوت گاهی توانایی یک فرد کافی نیست و مشارکت و همکاری افراد نیاز است. در دنیای کامپیوتر نیز سیستم های چند عامله متشکل از تعدادی عامل است که با یکدیگر در یک محیط در تعاملند. این سیستم ها ویژگی های خاصی دارند، از جلمه خود مختاری، عدم دسترسی به اطلاعات سراسری و به اشتراک گذاری دانش. در این سیستم ها تغییرات محیط وابسته به ترکیب عمل تولید شده از همه عامل ها می...
15 صفحه اولترکیب یادگیری تقویتی پیوسته و یادگیری باناظر برای ناوبری ربات
استفاده از یادگیری باناظر در ناوبری ربات های متحرک، دارای چالش های جدّی همچون ناسازگاری داده ها، مشکل جمع آوری داده های آموزشی وخطای زیاد در این داده ها می باشد. لیکن استفاده از یادگیری تقویتی، که یک روش یادگیری تعاملی قدرتمند می باشد، مورد توجه واقع شد. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. از این رو در این پایان نامه، یک ایده جدید برای استفاده موثّ...
15 صفحه اولیادگیری تقویتی براساس معماری عملگر- نقاد در سیستم های چند عامله برای کنترل ترافیک
در نیمه دوم قرن گذشته اغلب جوامع شاهد شروع پدیده ای بنام ترافیک شهری در خود بوده اند که علت رخداد چنین پدیده ای عبور تعداد زیادی خودرو در زمان یکسان از یک زیر ساخت حمل و نقلی یکسان می باشد. پدیده ترافیک شهری دارای پیامدهای اقتصادی و محیط زیستی کاملاً شناخته شده ای از جمله آلودگی هوا، کاهش در سرعت، افزایش زمان سفر، افزایش مصرف سوخت و حتی افزایش تصادفات می باشد. یکی از راه های اقتصادی برای مدیریت ...
full textکنترل ترافیک یک چهارراه راهنمایی رانندگی با استفاده از الگوریتمهای یادگیری تقویتی (یادگیری-Q، سارسا و مسیرهای شایستگی)
یکیازمهمتریناهدافپژوهشدرحوزهحملو نقل،بهینهکردنجریانهای ترافیک است. امروزه با افزایش وسایل نقلیه به طور پیوسته،محدودیت در منابعارائهشدهتوسطزیرساختهایفعلیو ماهیت غیرخطی، پویا و تصادفی بودن جریان ترافیک، استفاده از...
full textMy Resources
Journal title
volume 11 issue 2
pages 9- 21
publication date 2017-09
By following a journal you will be notified via email when a new issue of this journal is published.
No Keywords
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023